#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import pytesseract
from PIL import Image


# Tesseract-OCR图片文字识别，写入文件
def image_handle():
    image = Image.open('10086.jpg')
    text = pytesseract.image_to_string(image, lang='chi_sim')
    with open('output.txt', 'w', encoding='utf-8') as f:
        print(text)
        f.write(text)
# 用Tesseract-OCR可以识别格式规范的文字，主要具有以下特点：
# • 使用一个标准字体（不包含手写体、草书，或者十分“花哨的”字体）
# • 虽然被复印或拍照，字体还是很清晰，没有多余的痕迹或污点
# • 排列整齐，没有歪歪斜斜的字
# • 没有超出图片范围，也没有残缺不全，或紧紧贴在图片的边缘


if __name__ == '__main__':
    # 使用Tesseract-OCR
    image_handle()
    # 使用百度api
